今天來熟悉一下生成式AI, 因為在未來的幾天中一定會很常用到ChatGPT,來協助我完成學習,所以我想先開始了解生成式AI以及其原理,這樣能讓我能更容易理解,並開始技能的學習
生成式AI是一類能夠生成新內容(如文字、圖像、音頻等)的人工智慧模型。它能夠辨別傳統數據,還能創造新數據,這與傳統的判別模型(如分類模型)有很大區別。
常見的生成式模型:
簡單來說
GPT(生成預訓練變換器):可以生成自然語言文本,用於對話、故事創作等。
在現代是不可或缺的,能在很短的時間內,處理大量的文字內容,也可以產出有基本運行功能的程式碼,就像某些人說的一樣,現在正在進入no code的時代。其速度及可運作的規模之大,我可能需要好幾個小時來研究、撰寫,它可能幾秒就能完成。
GPT 如何運作?
雖然將 GPT 模型大約等於AI是準確的,但這是一個廣泛的描述。更具體來說,GPT 模型是在轉換程式架構上建置的神經網路型語言預測模型。這些模型可分析自然語言提示,並根據對語言的理解預測最佳的回應。
所以GPT模型依賴於在大量語言資料集上,使用上千億參數進行訓練後獲得的知識。他們可以考慮輸入內容並動態處理輸入的不同部分,使其能夠產生較常的回應,而不僅僅是序列中的下一個單詞。例如,要求產生一段莎士比亞風格的內容時,GPT 模型會記住並重新建構具有類似風格的“新”片語和整個句子,來實現目標提示。
有不同類型的神經網路,如遞歸和卷積。GPT 模型是轉換程式神經網路。轉換程式神經網路架構使用自我專注機制,在每個處理步驟中專注於輸入文字的不同部分。轉換程式模型會擷取更多內容,並改善自然語言處理 (NLP) 任務的效能。(從網站理解
GAN(生成對抗網絡):擅長生成逼真的圖像、影片等。
在網站的範例中能看到它對圖像的分解、補全、創作的能力,它有多種類型去匹配要使用的領域,
生成式對抗網路 (GAN) 是一種深度學習架構。它訓練兩個神經網路來彼此競爭,從指定的訓練資料集中產生更真實的新資料。例如,您可以從現有的影像資料庫中產生新影像,或從歌曲資料庫中產生原始音樂。GAN 之所以被認為具有對抗性,是因為它可以訓練兩個不同的網路並使它們相互對抗。一個網路採取輸入資料範例,並儘可能多地修改來產生新資料。另一個網路會嘗試預測產生的資料輸出是否屬於原始資料集。換言之,預測網路確定產生的資料是虛假還是真實。系統會產生較新的改進版假資料值,直至預測網路無法再區分虛假資料與原始資料。
機器學習的基礎
參考網站1:https://aws.amazon.com/tw/what-is/gpt/
參考網站2:https://aws.amazon.com/tw/what-is/gan/